Unraveling city-specific signature and identifying sample origin locations for the data from CAMDA MetaSUB challenge

نویسندگان

چکیده

Abstract Background Composition of microbial communities can be location-specific, and the different abundance taxon within location could help us to unravel city-specific signature predict sample origin locations accurately. In this study, whole genome shotgun (WGS) metagenomics data from samples across 16 cities around world another 8 were provided as main mystery datasets respectively part CAMDA 2019 MetaSUB “Forensic Challenge”. The feature selecting, normalization, three methods machine learning, PCoA (Principal Coordinates Analysis) ANCOM (Analysis composition microbiomes) conducted for both datasets. Results Features combined with machines learning methods, revealed that combination common features was effective predicting samples. average error rates 11.93 30.37% obtained respectively. Using dataset labels dataset, nearly 89.98% test correctly labeled “mystery” showed 60% total variability explained by first two axes. Although many overlapped, separation some found in PCoA. results ANCOM, importance score Random Forest, indicated “family”, “order” main-dataset most efficient information prediction Conclusions classification suggested microbiomes distinctive cities, which used identify origins. This also supported RF. addition, accuracy improved more better sequencing depth.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

metrics for the detection of changed buildings in 3d old vector maps using als data (case study: isfahan city)

هدف از این تحقیق، ارزیابی و بهبود متریک های موجود جهت تایید صحت نقشه های قدیمی سه بعدی برداری با استفاده از ابر نقطه حاصل از لیزر اسکن جدید شهر اصفهان می باشد . بنابراین ابر نقطه حاصل از لیزر اسکنر با چگالی حدودا سه نقطه در هر متر مربع جهت شناسایی عوارض تغییر کرده در نقشه های قدیمی سه بعدی استفاده شده است. تمرکز ما در این تحقیق بر روی ساختمان به عنوان یکی از اصلی ترین عارضه های شهری می باشد. من...

Identifying locations from geospatial trajectories

Harnessing the latent knowledge present in geospatial trajectories allows for the potential to revolutionise our understanding of behaviour. This paper discusses one component of such analysis, namely the extraction of significant locations. Specifically, we: (i) present the Gradient-based Visit Extractor (GVE) algorithm capable of extracting periods of low mobility from geospatial data, while ...

متن کامل

the search for the self in becketts theatre: waiting for godot and endgame

this thesis is based upon the works of samuel beckett. one of the greatest writers of contemporary literature. here, i have tried to focus on one of the main themes in becketts works: the search for the real "me" or the real self, which is not only a problem to be solved for beckett man but also for each of us. i have tried to show becketts techniques in approaching this unattainable goal, base...

15 صفحه اول

this study investigated the relationship between quality of work life and organization citizenship behavior from the viewpoint of teachers in high schools in tehran city.

چکیده هدف از پژوهش حاضر بررسی رابطه کیفیت زندگی کاری و رفتار شهروندی سازمانی در مدارس مقطع متوسطه پسرانه شهر تهران از دیدگاه دبیران بود. روش پژوهش حاضر توصیفی و از نوع همبستگی بود. از بین دبیران مدارس شهر تهران تعداد 380 نفر به روش نمونه گیری خوشه ای چند مرحله ای به عنوان نمونه پژوهش انتخاب شدند و با تکمیل پرسشنامه ی کیفیت زندگی کاری والتون(1975) و پرسشنامه ی رفتار شهروندی سازمانی پودساکو...

15 صفحه اول

Asymptotic algorithm for computing the sample variance of interval data

The problem of the sample variance computation for epistemic inter-val-valued data is, in general, NP-hard. Therefore, known efficient algorithms for computing variance require strong restrictions on admissible intervals like the no-subset property or heavy limitations on the number of possible intersections between intervals. A new asymptotic algorithm for computing the upper bound of the samp...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Biology Direct

سال: 2021

ISSN: ['1745-6150']

DOI: https://doi.org/10.1186/s13062-020-00284-1